Маркетинговый анализ игры "Космические братья"

Вы — маркетинговый аналитик стратегической игры "Космические братья".

В рамках исследования необходимо проанализировать поведение пользователей, пришедших из разных рекламных источников и определить, пользователей из каких источников наиболее выгодно привлекать.

Планируемая модель монетизации - показ рекламы в меню выбора типа объекта для постройки.

Предобработка данных

Загрузка и дубликаты

Загрузим датасеты и сразу посмотрим на дубликаты в них

Полный дубликат только один, в таблице 'actions', просто чтобы убедиться в корректности, посмотрим на него

Просто задублированное действие. Без зазрений совести убираем

Посмотрим на скрытые дубликаты по всем датасетам

Скрытых дубликатов нет, более того, значения столбца 'source' датасета 'costs' соответствуют значения столбца 'source' датасета 'sources'.

И ещё пара проверок просто на всякий случай.

Данные в датасетах корректные.

Пропуски

Пропуски есть в двух столбцах датасета 'actions': 'building_type' и 'project_type'.

Посмотрим на срез по незаполненным строкам в 'building_type' строкам и какие события им соответствуют.

Срез включает в себя все заполненные строки из столбца 'project_type'.

Получается, в этот срез попали события, не связанные со строительством зданий. Посмотрим, работает ли в обратную сторону.

Срезы друг-другу соответствуют. Предлагаю данные пропуски не трогать - по столбцу 'building_type' будет довольно просто посчитать количество построек, сделанных игроком, а столбец 'project_type' будет хорошим индикатором выполненного проекта.

Корректировка форматов данных

Скорректируем форматы данных. Корректировка необходима столбцам 'event_datetime' датасета 'actions' и 'day' датасета 'costs'. Второй таже требует приведения к дню.

Здесь же хочу проверить информацию по соответствию дат в столбце 'event_datetime' датасета 'actions' и столбце 'day' датасета 'costs'.

Судя по всему, реклама оплачивается на день вперёд, если она оплачена 3 мая, то показы начнутся 4 мая. Чтобы правильно посчитать CAC по игрокам, прибавим в датасете 'costs' всем датам 1 день.

Объединение таблиц, создание профилей

Создадим профили пользователей, где объединим всю необходимую информацию.

Начнём с информации, касающейся игрового процесса.

Теперь добавим информацию об источнике, откуда пришёл пользователь и cac.

Думаю, информации достаточно, приступим к анализу.

Исследовательский анализ

Распределение игроков по источникам привлечения и их CAC

Больше всего пользователей (немного более трети от всех пользователей) пришло через Яндекс Директ. На втором месте с четвертью пользователей - Instagram, оставшихся пользователей поделили между собой Facebook и Youtube.

Посмотрим, как приходили пользователи по дням.

В течение недели количество привлечённых пользователей заметно снижается, при этом соотношение в количестве пользователей по источникам остаётся похожим.

Возможно, причина такого снижения количества привлечённых пользователей в снижении затрат на рекламу. Проверим это.

В целом, динамика снижения затрат на рекламу похожа на динамику снижения количества новых пользователей.

Посмотрим на CAC по каналам.

Самым дорогим каналом оказался Facebook, он уверенно держит лидерство и только в последний день его CAC заметно опускается - почти до уровня второго места - Instagram. На третьем месте - Яндекс Директ, а самым дешёвым оказался Youtube.

В целом, все каналы, кроме Facebook имеют довольно стабильный CAC, без резких повышений и понижений.

Небольшое увеличение колебаний ближе к концу закупки скорее всего связаны с тем, что существенно уменьшились затрыты на рекламу по сравнению с началом периода.

Промежуточный вывод

Очень перспективно выглядит канал привлечения Яндекс Директ: через него пришло больше всего пользователей и CAC совсем не высокий.

Youtube тоже выглядит приятно из-за низкого CAC, но самый низкий показатель по количеству привлечённых пользователей не даёт его порекомендовать. Возможно, стоит немного пересмотреть характер рекламы в этом источнике, чтобы привлечь через него больше пользователей.

Точно не хочется рекомендовать Facebook, при низком показателе привлечённых пользователей (чуть выше, чем у Youtube), он обладает самым высоким CAC.

Распределение игроков по типам

Подавляющее число игроков первый уровень так и не завершило. Не знаю, насколько это типично для игры такого типа, но выглядит настораживающе. Возможно, стоит пересмотреть его наполнение и цели, ставящиеся перед игроком, чтобы он стал немного полегче.

Если говорить о людях, завершивших первый уровень, больше 2/3 человек решили завершить его как "Воители", победив соперника. И только небольшая часть игроков одержала победу через реализацию проекта.

Посмотрим, как типы игроков распределены по источникам привлечения.

Сильных перекосов по соотношению пользователей разных типов по разным источникам привлечения нет. Пользователи ведут себя одинаково.

Эти соотношения лучше покажет другой график.

Промежуточный вывод

Большинство игроков не завершило первый уровень. Возможно, стоит пересмотреть его наполнение и цели, ставящиеся перед игроком, чтобы он стал немного полегче. Из прошедших первый уровень более 2/3 относятся к типу "Воитель".

В разрезе по каналам практически нет различий в поведении игроков, соотношения типов игроков одинаковые.

Анализ количества построенных зданий

Сначала посмотрим, как распределён этот показатель.

Всего игроки построили почти 128 тысяч зданий, минимум 1, максимум 20. В среднем на одного игрока приходится 9 с половиной зданий.

По графику видно, что игроки чаще всего строят от 9 до 11 зданий, но есть ещё одно часто встречающееся значение - 6 зданий. Между этими значениями - провал на 7 зданиях. Возможно, эти пики сформированы игроками разных типов, проверим это дальше.

В целом, сильных выбросов по количеству зданий нет, данные вглядят готовыми к дальнейшему анализу.

Посмотрим, как выдит картина в зависимости от типа игрока.

Игроки, не прошедшие 1 уровень формируют большинство игроков, постоивших только 6 зданий, после этого идёт провал на 7 зданиях, также как и на общем графике, с последующим небольшгим повышением к 9 зданиям. Их среднее значение построек 8.66 на одного игрока.

У "Воителей" ситуация похожая, но у них пиковое значение игроков остановилось на 9 зданиях, а на 6 так сделала только небольшая часть игроков. Также виден провал на 7 зданиях. Среднее значение построек на единицу больше, чем у не завершивших и равно 9.41.

Складывается ощущение, что на 7 зданиях для игроки проходят "психологический" барьер, на котором они либо бросают игру, либо решают играть дальше.

У "Исследователей" ситуация совсем другая. Игроки, завершившие первый уровень через реализацию проекта строят минимум 10 зданий, при этом большинство игроков останавливаются как раз на 10-12 зданиях, похоже это минимальное значение, нужное для реализации проекта. Среднее значение построек намного больше, чем у двух предыдущих категорий - 12.65.

В рамках планируемой модели монетизации, самыми интересными выглядят именно "Исследователи", но, учитывая что для реализации проекта нужно минимум 10 зданий, стоит пересмотреть геймплей, чтобы сместить "психологический" барьер в 7 зданий на более высокое число.

Давайте посмотрим на медианные значения этих групп игроков.

Здесь разница заметна лучше. Медианное значение количества построенных зданий у игроков, не завершивших первый уровень, заметно ниже, чем у "Воителей" (8 против 10). "Исследователи" всё также выглядят более перспективно, медианное значение у них также самое высокое - 12.

Рассмотрим количество построенных игроками зданий в разрезе источников привлечения.

Между истониками картина очень похожая, почти идентичная. Количество построенных зданий разнится, но на это скорее влияет общее количество привлечённых через этот источник пользователей: средние значения построенных зданий очень близко друг к другу.

Выделить можно разве что небольшую особенность игроков из источников Facebook и Instagram: у них немного ниже доля игроков, остановившихся на 6 зданиях.

Посмотрим на медианные значения в разрезе источников привлечения.

Все три графика идентичны. В целом, поведение игроков очень слабо зависит от источника привлечения.

Промежуточный вывод

Количество возводимых игроком зданий больше зависит от того, какие цели он ставит перед собой в игре. "Исследователи", реализующие проект, строят здание явно охотнее других игроков. Но для проекта нужно минимум 10 зданий, в то время как многие игроки не доходят до 7. Думаю, стоит исследовать это барьерное значение и понять, почему игроки могут застревать на этом значении.

Источник привлечения слабо влияет на поведение игрока в части постройки зданий.

Вывод по разделу

Большинство игроков (57,2%) так и не завершили первый уровень игры. Если говорить о людях, завершивших первый уровень, больше 2/3 человек решили завершить его как "Воители", победив соперника. И только небольшая часть игроков одержала победу через реализацию проекта. Причём эти доли в целом сохраняются для всех источников привелечения.

Количество возводимых игроком зданий больше зависит от того, какие цели он ставит перед собой в игре. "Исследователи", реализующие проект, строят здание явно охотнее других игроков. Но для проекта нужно минимум 10 зданий, в то время как многие игроки не доходят до 7. Источник привлечения слабо влияет на поведение игрока в части постройки зданий.

Возможно, стоит пересмотреть наполнение и цели, ставящиеся перед игроком, во время прохождения первого уровня игры чтобы он стал немного полегче. Также, стоит исследовать барьерное значение в 7 построек и понять, почему игроки могут застревать на этом значении.

Среди каналов привлечения хочу отметить Яндекс Директ: через него пришло больше всего пользователей и CAC совсем не высокий (среднее значение 0,46). Youtube тоже выглядит приятно из-за низкого CAC, но самый низкий показатель по количеству привлечённых пользователей не даёт его однозначно порекомендовать. Возможно, стоит немного пересмотреть характер рекламы в этом источнике, чтобы привлечь через него больше пользователей.

Точно не хочется рекомендовать Facebook, при низком показателе привлечённых пользователей (чуть выше, чем у Youtube), он обладает самым высоким CAC (среднее значение 0,79).

Статистический анализ

Проверка первой гипотезы

Перед сравнение времени прохождения первого уровня, посмотрим, как распределены значения времени для типов игроков "Воитель" и "Исследователь".

Обе выборки нормально распределены и не имеют огромных выбросов, думаю, можно начать анализ без изменений.

Примем нулевую гипотезу - среднее время завершения первого уровня не различается для типов игрока "Воитель" и "Исследователь".

Уровень alpha принимаю за 0.05, проверка проводится с помощью t-теста. Параметр equal_var установим в значение False так как сравниваемые выборки не равны между собой.

Отвергаем нулевую гипотезу. P-value фактически равно нулю. В среднем, "Исследователи" завершают 1 уровень на 21.20% дольше, чем "Воители".

Проверка второй гипотезы

Распределение количества зданий рассматривали выше, можно считать, что выборки распределены нормально и и не имеют огромных выбросов, думаю, можно начать анализ без изменений.

Примем нулевую гипотезу - количество построек, сделанных игроками не отличается для типов игрока "Воитель" и "Исследователь".

Уровень alpha принимаю за 0.05, проверка проводится с помощью t-теста. Параметр equal_var установим в значение False так как сравниваемые выборки не равны между собой.

Отвергаем нулевую гипотезу. P-value равно нулю. В среднем, "Исследователи" строят на 34.39% больше, чем "Воители".

Вывод по разделу

Группы игроков "Исследователи" и "Воители" очень сильно различаются между собой. Цели, которое ставят перед собой "Исследователи", стимулируют их строить сильно большее количество зданий, также, увеличивают время, за которое они проходят 1 уровень.

Общие выводы

Поведение игроков слабо зависит от источника, через который они пришли. Поэтому для его рекомендации можно опираться только на показатели количества привлечённых пользователей и CAC. Самым перспективным по сочетанию этих показателей выглядит Яндекс Директ: через него пришло больше всего пользователей (35,5% от общего числа) и CAC совсем не высокий, среднее значение 0,46. Дешевле только один источник - Youtube, но у него самый низкий показатель по количеству привлечённых пользователей. Возможно, стоит немного пересмотреть характер рекламы в этом источнике, чтобы привлечь через него больше пользователей.

Группы игроков "Исследователи" (завершившие проект) и "Воители" (подебившие противника) очень сильно различаются между собой. Цели, которое ставят перед собой "Исследователи", стимулируют их строить сильно большее количество зданий (среднее количество - 12.65 на игрока), также, увеличивают время, за которое они проходят 1 уровень.

Большинство игроков (57,2%) так и не завершили первый уровень игры. Также, многие игроки "застряли" на постройке 6 зданий и не стали строить больше. Возможно, стоит пересмотреть наполнение и цели, ставящиеся перед игроком, во время прохождения первого уровня игры чтобы он стал немного полегче. Также, стоит исследовать барьерное значение в 7 построек и понять, почему игроки могут застревать на этом значении.